会议主席

鲍捷

师从图灵奖获得者 Tim Berners-Lee 与 James A. Hendler两位知识图谱领域创始人,衣阿华州立大学博士、伦斯勒理工学院(RPI)博士后、MIT访问研究员。研究领域涵盖自然语言处理、语义网、机器学习和描述逻辑等,在AAAI, ISWC,ESWC和ASWC等语义网核心期刊和会议上发表论文70余篇。目前任中国中文信息学会语言与知识计算专委会委员,W3C顾问委员会委员,中国计算机学会会刊(CCCF)编委,中文开放知识图谱联盟(OpenKG)发起人之一,清华大学大数据研究院大数据基础设施研究中心特聘研究员。


特邀讲者

赵东岩

主题报告一:知识图谱的关键技术及其智能应用

主题简介: 随着自然语言处理等相关技术的发展,知识图谱已经成为工业界开展下一代人工智能应用的重要基础。本报告将从知识图谱构建、补全及其人机交互问答等方面系统阐述知识图谱的关键技术方案;并将结合北大计算机研究所在这个研究方向上的具体进展,以实际应用为背景、探讨如何基于知识图谱实现智能问答等智能应用的技术路线。

个人简介:赵东岩,北京大学计算机科学技术研究所研究员,博士生导师。主要研究方向为自然语言处理、语义数据管理、智能服务技术。近年来承担国家自然科学基金、863/重点研发计划等国家级项目15项、主持7项;发表学术论文100余篇(包括ACL、AAAI、IJCAI、SIGKDD、SIGIR、SIGMOD、VLDB,AI Journal、TKDE、VLDB Journal等顶级会议和期刊50余篇);授权发明专利20项;先后七次获得国家和省部级奖励,包括 2006年度国家科技进步二等奖(排名第一)。个人获第十届中国青年科技奖和北京市第七届“科技之光”技术创新特别奖等荣誉。中国计算机学会(CCF)杰出会员,CCF中文信息技术专委会秘书长、CCF大数据专家委员会委员、CCF网络与数据通信专委会委员。


白雪

主题报告二:从产业链知识图谱到金融事理图谱

主题简介:知识图谱主要表示的是关于实体的知识,围绕着实体、关系、属性的各种表示、演化和推理技术。事件的加入,从实用角度丰富了知识图谱所能表示的语义对象的范围。从静态到动态,从表达静态知识到推导动态演化,知识图谱进阶到联动事理图谱,则可进行投研逻辑推理。金融知识图谱的应用目前尚处于初级阶段,面临着很多实际问题,如实体粒度选择、不同层级映射、Schema定义、子图融合、数据关联、事件作用等等。本报告主要分享从产业链知识图谱到金融事理图谱的实践、问题以及对策。

个人简介:白雪,丹渥智能联合创始人、总经理。复旦大学计算机学院人工智能方向博士,上海证券交易所资本市场研究所博士后研究员,罗格斯-新泽西州立大学访问学者。在上海证券交易所工作期间,主持了证券知识图谱等多个证券系统重点研究项目。在金融知识图谱方向有着丰富的理论和实践经验,带领团队建设全产业链知识图谱并在券商、银行多个领域落地应用。


闫峻

主题报告三:基于真实世界数据的医疗知识图谱构建 - 挑战与方法


主题简介:知识图谱在医疗健康领域的构建和应用近期吸引了越来越多来自学术界及工业界的目光。医疗知识图谱的构建即可以基于指南,书籍,文献等做知识抽取,也可以基于领域专家对知识的编辑。还有重要的一类知识来源是基于真实世界数据的知识挖掘。我们这次报告的重点是基于以临床电子病历为代表的真实世界数据医疗知识图谱构建中的主要问题,挑战极其解决办法。我们将从临床电子病历的数据质量问题谈起,介绍如何通过构建医学常识知识库等方法保证知识来源的质量。接下来介绍实体识别及实体标准化在医疗文本上的技术特殊性与挑战,并以案例介绍实践中更高效的解决办法。接下来会简单介绍真实世界医疗数据挖掘在落地过程中的其它挑战及对应算法框架。最后将进行一些应用案例的分享。

个人简介:闫峻博士于2006年在北京大学数学学院信息科学系获得博士学位。于 2006 年 7 月加入微软亚洲研究院工作。于2017年加入医渡云任首席人工智能科学家。他的研究兴趣包括知识挖掘,基于知识的机器学习,文本处理技术,信息检索等并更加关注医疗健康领域的人工智能研究。至今为止获取技术专利数十项,发表高质量学术论文 80 余篇,包括 SIGKDD, SIGIR, WWW, ICDM, TKDE 等。他是很多高质量学术会议的程序委员会成员及资深程序委员会成员, 并且是很多高质量期刊的审稿人。曾任CCKS工业论坛主席,世界人工智能技术大会青年科学家论坛主席,中山大学博士生导师,人民大学工程硕士导师。 现为中文信息学会语言与知识计算专业委员会委员,中文信息学会医疗健康与生物信息处理专业委员会委员。西安交通大学博士生企业导师。国家药监局AI医疗器械标准化技术专家组观察员,国家卫健委、发改委、北京科委等若干医疗大数据与知识图谱重点项目课题负责人。


王会珍

主题报告四:数据标注助力认知智能行业化应用落地

主题简介:本报告将重点介绍小牛思拓在人机交互智能数据标注服务方面的进展,介绍小牛数据标注系统的框架设计、服务模式,分享数据标注实施过程中的经验教训,以及高质量数据在认知智能行业化应用落地的经验和结果。

个人简介:毕业于东北大学自然语言处理实验室。现任小牛思拓(北京)科技有限公司CEO,负责公司NLP相关能力的积累和规划、核心产品的设计及相关的研发人才梯队的建设工作及全面管理工作。主持开发了文本智能处理和NLP应用平台:文档格式检验、分句、分词、命名实体识别、文本摘要、情感分析、情报分析等功能;开发了数据采集平台以及人机交互智能数据标注平台。其中数据标注平台已服务于几十家研究机构及人工智能方面创业企业,帮助企业利用高质量标注数据提升产品及解决方案的性能。


段楠

主题报告五:预训练模型最新进展及其在跨任务、跨语言和跨模态场景下的应用

主题简介:近年来,预训练模型(例如ELMo、GPT、BERT和XLNet等)的快速发展大幅提升了诸多NLP任务的整体水平,同时也使得很多应用场景进入到实际落地阶段。本次报告将从三方面介绍预训练研究的最新进展:(1)跨任务,介绍预训练模型如何从单语数据中学习自然语言的通用表示,并将其用于不同任务中;(2)跨语言,介绍预训练模型如何从单语数据和双语数据中学习同一语义在不同语言中的对应知识,并将其用于不同语言中;(3)跨模态,介绍预训练模型如何从跨模态数据中学习同一语义在不同模态数据中的对应知识,并将其用于跨模态任务中。最后,将和大家一起探讨该方向在实际落地中存在的一些问题,及可能的解决方案。

个人简介:段楠博士,微软亚洲研究院自然语言计算组高级研究员,从事自然语言处理方面的基础研究,在ACL、EMNLP、COLING、AAAI、IJCAI、CVPR、KDD、NIPS等国际会议中发表论文40余篇。多项研究成果成功应用到微软人工智能产品中,包括必应搜索、必应广告、微软新闻、Cortana语音助手和微软小冰等。著有《智能问答》一书(高等教育出版社)。